Extraction possibiliste de concepts MeSH à partir de documents biomédicaux

نویسندگان

  • Wiem Chebil
  • Lina Fatima Soualmia
  • Mohamed Nazih Omri
  • Stéfan Jacques Darmoni
چکیده

RESUME. Nous proposons dans cet article une nouvelle approche d’indexation de documents biomédicaux basée sur les réseaux possibilistes permettant de les apparier partiellement aux termes du thésaurus MeSH (Medical Subject Headings). La principale contribution de notre approche est le traitement de l’imprécision et de l’incertitude liée à la tâche d’indexation à travers l’utilisation de la théorie des possibilités. En effet, nous proposons d’améliorer l’estimation de la pertinence d’un document étant donné un concept en utilisant deux mesures : la possibilité et la nécessité. La possibilité estime le degré de rejet d’un document non pertinent étant donné un concept. La nécessité de la pertinence d’un document évalue dans quelle mesure un document est pertinent pour le concept. De plus, notre approche permet de réduire les limites de l’appariement partiel qui génère de l’information inutile, bien que ce type d’appariement permette de trouver dans le document d’autres variantes du vocabulaire contrôlé. Pour ce faire, nous proposons de filtrer l’index en utilisant les connaissances fournies par l’UMLS (Unified Medical Langage System). Filtrer l’index permet de ne garder que les concepts pertinents parmi ceux ayant un sous-ensemble de leurs mots dans le document. Les expérimentations réalisées sur les deux corpus OSHUMED et CISMeF ont montré des résultats encourageants.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Extraction et identification d'entités complexes à partir de textes biomédicaux

Résumé. Nous présentons ici un système d’extraction et d’identification d’entités nommées complexes à l’intention des corpus de spécialité biomédicale. Nous avons développé une méthode qui repose sur une approche mixte à base d’ensemble de règles a priori et de dictionnaires contrôlés. Cet article expose les techniques que nous avons mises en place pour éviter ou minimiser les problèmes de syno...

متن کامل

Traduction automatique de termes biomédicaux pour la recherche d'information interlingue

RÉSUMÉ. Dans cet article, nous présentons une méthode de traduction automatique de termes biomédicaux. Cette méthode s’appuie sur une technique originale d’apprentissage supervisé de règles de réécriture et sur l’utilisation de modèles de langue. Les évaluations présentées montrent que notre technique est très performante et permet de traduire à partir et à destination de n’importe quelle langu...

متن کامل

Fouille de données complexes et logique floue : extraction de motifs à partir de bases de données multidimensionnelles. (Fuzzy and Complex Data Mining: Knowledge Discovery from Multidimensional Data)

HAL is a multi-disciplinary open access archive for the deposit and dissemination of scientific research documents, whether they are published or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers. L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau...

متن کامل

Apprentissage d'une hiérarchie de concepts pour la conception de modèles de domaine d'hypermédias

Résumé. Nous décrivons comment apprendre automatiquement une hiérarchie de concepts à partir d'une collection de documents. Les concepts, identifiés par des ensembles de mots-clés, sont organisés en une hiérarchie de type spécialisation/généralisation. Cette hiérarchie peut être utilisée pour construire un modèle de domaine pour des collections de documents hypermédias. Nous proposons des idées...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:
  • Revue d'Intelligence Artificielle

دوره 28  شماره 

صفحات  -

تاریخ انتشار 2014